source("comm\\description.r")
data<-read.csv("D:\\FanLi\\02.基础模型\\y01.预订单模型三期\\98.data\\incr_d_odr_pre_order_taobaoke1204.csv",header = T)

x<-data$product_type
y<-data$child_order_amount

##1 数值型
data_Description(y)
summary(x)
quantile(x,seq(0,1,0.05))  #分位数
t.test(x)  ##x的置信区间

hist(x) # 直方图
plot(density(x)) # 密度分布图

##2 枚举型
sum(is.na(x))  #缺失值统计
table(x)     #频数分析
barplot(table(x))     #先频数分析，再直方图    
barplot(table(x)/length(x)) #频率图
pie(table(x))     #饼图

##3 多变量
#3.1 分类变量
table(x,y)

#3.2 数值变量
plot(x,y)     #散点图
cor(x,y)     #相关系数

#3.3 分类汇总
aggregate(y ~ x, summary, data=data)  #x是分类变量，y是数值变量
aggregate(y ~ x, FUN="sum", data=data)  #x是分类变量，y是数值变量

